智能论文笔记

Learning to regulate 3D head shape by removing occluding hair from in-the-wild images

Sohan Anisetty , Varsha Saravanabavan , Cai Yiyu

分类：计算机视觉

2022-08-25

与仅对面部进行建模的早期方法相比，最近的3D面部重建方法重建了整个头部。尽管这些方法准确地重建了面部特征，但它们并未明确调节头部的上部。由于头发的闭塞程度不同，提取有关头部这一部分的信息具有挑战性。我们提出了一种新颖的方法，可以通过去除遮挡头发并重建皮肤，从而揭示有关头部形状的信息来建模上头。我们介绍了三个目标：1）骰子一致性损失，该骰子一致性损失在源的整体形状和渲染图像之间强制相似，2）刻度一致性损失，以确保即使头部的上部不是头部，也可以准确地复制头部形状可见，3）使用移动平均损耗功能训练的71个地标探测器，以检测头部的其他地标。这些目标用于以无监督的方式训练编码器，以从野外输入图像中回归火焰参数。我们无监督的3MM模型可在流行的基准上实现最新的结果，可用于推断动画或阿凡达创建中直接使用的头部形状，面部特征和纹理。

translated by 谷歌翻译

Latent Diffusion for Language Generation

Justin Lovelace , Varsha Kishore , Chao Wan , Eliot Shekhtman , Kilian Weinberger

分类：自然语言处理 | 机器学习

2022-12-19

Diffusion models have achieved great success in modeling continuous data modalities such as images, audio, and video, but have seen limited use in discrete domains such as language. Recent attempts to adapt diffusion to language have presented diffusion as an alternative to autoregressive language generation. We instead view diffusion as a complementary method that can augment the generative capabilities of existing pre-trained language models. We demonstrate that continuous diffusion models can be learned in the latent space of a pre-trained encoder-decoder model, enabling us to sample continuous latent representations that can be decoded into natural language with the pre-trained decoder. We show that our latent diffusion models are more effective at sampling novel text from data distributions than a strong autoregressive baseline and also enable controllable generation.

translated by 谷歌翻译

Sample Complexity of an Adversarial Attack on UCB-based Best-arm Identification Policy

Varsha Pendyala

分类：机器学习 | 人工智能

2022-09-13

在这项工作中，我研究了在多军强盗（MAB）设置中，对抗性扰动的问题。具体而言，我专注于对应用于随机mAB的UCB类型最佳武器标识策略的对抗性攻击。[1]中提出的UCB攻击导致经常拉动目标臂K。我使用[1]的攻击模型来得出选择目标臂K作为最佳臂所需的样品复杂性。我已经证明，[2]中给出的基于UCB的最佳臂识别算法的停止条件可以通过目标臂K在T回合中实现$ \ sigma^2- $ sup-gaussian武器随机奖励。

translated by 谷歌翻译

Concept-Based Explanations for Tabular Data

Varsha Pendyala , Jihye Choi

分类：机器学习 | 计算机视觉

2022-09-13

机器学习模型的解释性一直是机器学习系统安全部署的重要领域。一种特殊的方法是将模型决策归因于人类可以理解的高级概念。但是，这种基于概念的深度神经网络（DNN）的解释性主要在图像域上进行了研究。在本文中，我们通过提供有关如何在表格数据上定义概念的想法，将概念归因方法（概念归因方法）扩展到表格学习。在具有基本概念解释和现实世界数据集的合成数据集中，我们显示了方法在生成与人类水平直觉相匹配的可解释性结果方面的有效性。最重要的是，我们提出了一个基于TCAV的公平性概念，该概念量化了哪个DNN层学习的表示形式，从而导致对模型的偏见。另外，我们从经验上证明了基于TCAV的公平性与群体公平概念，人口统计学的关系。

translated by 谷歌翻译

Predicting Gender via Eye Movements

Rishabh Vallabh Varsha Haria , Sahar Mahdie Klim Al Zaidawi , Sebastian Maneth

分类：机器学习

2022-06-15

在本文中，我们报告了通过眼动的性别预测的第一个稳定结果。我们使用带有面部图像的数据集作为刺激和大量370名参与者。稳定性对我们有两种含义：首先，我们能够估计单个预测实验的标准偏差（SD）（约为4.1％）；这是通过改变参与者人数来实现的。其次，我们能够提供具有非常低标准误差的平均准确性（SEM）：我们的精度为65.2％，SEM为0.80％；这是通过许多随机选择预测的训练和测试集来实现的。我们的研究表明，两个特定的分类器达到了最佳精度：随机森林和逻辑回归。我们的结果重新确认了先前的发现，即女性对刺激的左眼更有偏见。

translated by 谷歌翻译

Evaluating Pretrained Transformer Models for Entity Linking in Task-Oriented Dialog

Sai Muralidhar Jayanthi , Varsha Embar , Karthik Raghunathan

分类：自然语言处理

2021-12-15

对自然语言任务的预磨削变压器模型（PTMS）的广泛适用性得到了很好的展示，但它们理解短语短语的能力不太探讨。为此，我们从横跨5个特征的面向任务对话框中链接的无监督实体镜头评估不同的PTMS - 句法，语义，短语，数字和语音。我们的结果表明，与传统技术相比，几种PTM产生了亚映射结果，尽管对其他神经基线具有竞争力。我们发现，通过使用PTMS微调的文本相似性任务可以解决一些缺点，这说明了理解语义和句法对应的能力，以及实体的短语，数字和语音变化的一些改进提到。我们进行定性分析，以了解他们预测中的细微差别，并讨论进一步改进的范围。可以在https://github.com/murali1996/el_tod找到代码

translated by 谷歌翻译

Real-time Emotion and Gender Classification using Ensemble CNN

Abhinav Lahariya , Varsha Singh , Uma Shanker Tiwary

分类：计算机视觉

2021-11-15

分析对人脸上的表达在识别人的情绪和行为方面发挥着非常重要的作用。识别这些表达式会自动导致自然人机接口的重要组成部分。因此，该领域的研究在生物公制认证，监控系统，情感到各种社交媒体平台中的情感方面具有广泛的应用。另一个申请包括进行客户满意度调查。正如我们所知，大型公司使巨额投资获得反馈并进行调查，但未能获得公平的反应。通过面部手势的情感和性别识别是一种技术，旨在通过他们的评价监测客户行为来改善产品和服务性能。在过去几年中，在特征提取机制，面部检测和表达分类技术方面已经进行了各种各样的进展。本文是实施一个用于构建可以检测到人的情绪和性别的实时系统的集合CNN。实验结果表明，在FER-2013 DataSet上的7个课程（愤怒，恐惧，悲伤，快乐，惊喜，中立，中立，厌恶）和IMDB数据集上的性别分类（男性或女性）的95％，精度为68％的准确性。我们的工作可以预测单一面部图像以及多个面部图像的情感和性别。此外，当通过网络摄像头给出输入时，我们的完整流水线可以花费小于0.5秒才能生成结果。

translated by 谷歌翻译

BERTScore: Evaluating Text Generation with BERT

Tianyi Zhang , Varsha Kishore , Felix Wu , Kilian Q. Weinberger , Yoav Artzi

分类：

2019-04-21

We propose BERTSCORE, an automatic evaluation metric for text generation. Analogously to common metrics, BERTSCORE computes a similarity score for each token in the candidate sentence with each token in the reference sentence. However, instead of exact matches, we compute token similarity using contextual embeddings. We evaluate using the outputs of 363 machine translation and image captioning systems. BERTSCORE correlates better with human judgments and provides stronger model selection performance than existing metrics. Finally, we use an adversarial paraphrase detection task to show that BERTSCORE is more robust to challenging examples when compared to existing metrics.

translated by 谷歌翻译